遥控器的日益普及的普及程度增加了对追踪人类姿势的高度准确的计算机视觉模型的需求。但是,最好的方法仍然失败,在许多真实的健身场景中,这表明当前数据集和现实世界的健身数据之间存在域间差距。为了使现场能够解决特定于健身的视觉问题,我们创建了InfiniteForm,具有各种健身姿势(15个类别)的60K图像的开源合成数据集,单人和多人场景,以及照明,相机的现实变化角度和闭塞。作为合成数据集,InfiniteForm在身体形状和肤色中提供最小的偏差,并为2D关键点提供标准注释的像素完美标签,以及人类难以或不可能产生像深度和遮挡的标准注释。此外,我们还介绍了一种新的生成过程,用于从预定义的锻炼类别创建不同的合成姿势。该生成过程可以扩展到培训强大的计算机视觉模型所需的任何应用程序。
translated by 谷歌翻译